概率存在于心智之中
❦
在上一篇随笔里,我谈到了「心智投射谬误(Mind Projection Fallacy)」,举的例子是这样一个外星怪物:它掳走一位衣裙被撕裂的女孩,意图施暴——而我把这种错误归因于艺术家的一种倾向:他们会认为,女性的性感是女性自身的一个属性,即 Woman.sexiness,而不是观察者心智中的某种东西;而在外星人的心智里,它很可能根本就不存在。
「心智投射谬误」这个术语,是已故的伟大贝叶斯大师 E. T. Jaynes 提出的,作为他与那些可憎的频率派长期艰苦斗争的一部分。Jaynes 认为,概率存在于心智之中,而不是环境之中——概率表达的是无知,是局部信息状态;而如果我对某个现象一无所知,那是我的心智状态的一个事实,而不是那个现象本身的一个事实。
我无法用寥寥数语公正地概括这场古老战争——但这场争论的经典例子大致如下:
你有一枚硬币。
这枚硬币是偏的。
你不知道它偏向哪一面,也不知道偏了多少。有人只是告诉你:「这枚硬币是偏的。」除此之外,什么都没说。
这就是你拥有的全部信息,也是你唯一拥有的信息。你把硬币掏出来,抛向空中,然后啪地拍在桌上。
现在——在你移开手、看到结果之前——你愿意说,你赋予这枚硬币正面朝上的概率是 0.5 吗?
频率派会说:「不。说『概率 0.5』,意味着这枚硬币具有一种内在倾向,会让它正反面出现得一样频繁,所以如果我们把这枚硬币抛无穷多次,正反面的比例就会趋近于 1:1。但我们知道这枚硬币是偏的,所以它正面朝上的概率可以是除 0.5 之外的任何值。」
贝叶斯派会说:「不确定性存在于地图之中,而不在疆域之中。在现实世界里,这枚硬币要么已经正面朝上,要么已经反面朝上。任何关于『概率』的说法,都必须指向我对这枚硬币所掌握的信息——我那种部分无知、部分知晓的状态——而不只是硬币本身。更进一步,我还有一整套定理证明:如果我不以某种方式来对待我的局部知识,我就会下出愚蠢的赌注。如果我必须作规划,那么我就会按一种 50/50 的不确定状态来规划,在我的心里,不会对「硬币正面朝上」条件下的结果赋予比「硬币反面朝上」条件下的结果更大的权重。你爱把这个数叫什么都行,但如果不想犯蠢,它就必须服从概率法则。所以,我丝毫不犹豫地把这种结果加权称作概率。」
我站在贝叶斯派这一边。你大概已经看出来了。
甚至在一枚公平硬币被抛出之前,说它内在地有 50% 的概率正面朝上,也可能压根就是错的。也许你拿硬币的方式,再加上你抛掷的力度和周围的气流,会让它几乎注定正面朝上,或者反面朝上。但如果你并不知道这一次它会偏向哪边,那又怎样?
我记得似乎有过这样一桩诉讼:有人指控征兵抽签不公平,因为写有名字的纸条没有被充分混匀;而法官回答说:「这对谁不公平?」
为了让抛硬币实验具有可重复性——频率派总爱提出这种要求——我们可以造一台自动抛硬币机,并验证它的结果是 50% 正面、50% 反面。但假设有一个眼睛极其敏锐、又非常懂物理学的机器人,在自动抛硬币机准备抛出之前就盯着它看,能够提前预测硬币会落向哪一面——不是百分之百确定,而是有 90% 的准确率。那时,真正的概率又会是多少?
并不存在什么「真正的概率」。那个机器人拥有一种局部信息状态。你拥有另一种局部信息状态。硬币本身没有心智,也不会给任何事情赋予概率;它只是被抛到空中,转上几圈,撞上一些空气分子,然后以正面或反面落下。
这就是贝叶斯派对这类事情的看法。而我现在想指出几个经典的烧脑题:它们之所以显得烧脑,正是因为人们倾向于把概率想成物体固有的属性。
先来看一个老经典:你在街上碰到一位数学家,她顺口提到,她在两个不同的时间点生了两个孩子。你问:「你的孩子里至少有一个是男孩吗?」数学家说:「是的,有一个是。」
她有两个男孩的概率是多少?如果你假定一个孩子是男孩的先验概率是 1/2,那么在已知信息下,她有两个男孩的概率就是 1/3。先验概率分别是:1/4 两个男孩,1/2 一男一女,1/4 两个女孩。数学家回答「是」这件事,在前两种情况下的概率约为 1,在第三种情况下的概率约为 ∼0。重新归一化之后,就得到 1/3 的概率是两个男孩,2/3 的概率是一男一女。
但假如你问的不是这个,而是:「你的大孩子是男孩吗?」而数学家回答「是。」那么数学家有两个男孩的概率就是 1/2。因为既然大孩子是男孩,小孩子就可以是什么都行。
同样地,如果你问的是:「你的小孩子是男孩吗?」那么他们两个都是男孩的概率,同样还是 1/2。
可现在,如果至少有一个孩子是男孩,那么这个男孩要么是老大,要么是老二。那为什么第一种问法的答案会和后两种不同?
再看一个非常相似的问题:假设我有四张牌,红桃 A、黑桃 A、红桃 2 和黑桃 2。我随机抽出两张牌。你问我:「你手里至少有一张 A 吗?」我回答「有。」那么,我手里是一对 A 的概率是多少?答案是 1/5。一共存在六种等先验概率的两张牌组合,而你刚刚排除了我手里是一对 2 的可能性。在剩下的五种组合里,只有一种是一对 A。所以是 1/5。
现在假设你改问我:「你手里有黑桃 A 吗?」如果我回答「有」,那么另一张牌是红桃 A 的概率就是 1/3。(你知道我拿着黑桃 A,而另一张牌有三种可能,其中只有一种是红桃 A。)同理,如果你问我:「你手里有红桃 A 吗?」而我回答「有」,那么我手里是一对 A 的概率也是 1/3。
可这样一来,如果你问我:「你手里至少有一张 A 吗?」而我说「有」,为什么我手里是一对 A 的概率会是 1/5 呢?你知道,要么我手里有黑桃 A,要么我手里有红桃 A;而无论哪种情况,我手里是一对 A 的概率都应该是 1/3。
这怎么可能?是不是这些概率里有一个或多个是我算错了?
如果你想自己先想出答案,那就现在想,因为我马上就要揭晓……
以上所有计算都对。
至于所谓悖论,其实并不存在。这种看起来像悖论的感觉,来自把概率想成牌本身的固有属性。我手里的那张 A 必然要么是红桃,要么是黑桃;但这并不意味着,你对我手里牌的认知,就必须和你知道我拿的是红桃时完全一样,或者和你知道我拿的是黑桃时完全一样。
也许借助贝叶斯定理来想,会更容易一些:
| P(H|E) | = | P(E|H)P(H) |
||
| P(E) |
最后那一项,也就是你要除以 P(E) 的那部分,就是你把所有已经被排除的可能性丢掉,再对剩余部分重新归一化的地方。
现在假设你问我:「你手里至少有一张 A 吗?」在我回答之前,你对我会回答「有」的概率,应当是 5/6。
但如果你问我:「你手里有黑桃 A 吗?」那么你先验上认为我会回答「有」的概率就只有 1/2。
所以你立刻就能看出来,在这两种情况下,你学到的东西其实完全不同。你会排除掉不同的可能性,并用不同的 P(E) 来重新归一化。如果你学到了两条不同的证据,那么最终落入两种不同的局部信息状态,也就不足为奇了。
同样地,如果我问那位数学家:「你的两个孩子里至少有一个是男孩吗?」那么我预期听到「是」的概率是 3/4;但如果我问的是:「你的大孩子是男孩吗?」那么我预期听到「是」的概率就是 1/2。所以,根据我问的是哪一个问题,最后落入不同的局部知识状态,也毫不奇怪。
你之所以会看到一个「悖论」,唯一的原因就是:你在想问题时,仿佛拿着一对 A 的概率是牌本身的一个属性,只要这手牌里至少有一张 A,这个属性就已经在那里了;或者仿佛只要牌组恰好包含黑桃 A,拿到一对 A 的概率就是牌组本身的属性。那样的话,确实就会很悖论:包含至少一张 A 的牌组,其内在的成对概率是 1/5;而包含黑桃 A 的牌组,其内在的成对概率却是 1/3;包含红桃 A 的牌组,其内在的成对概率也又是 1/3。
同样地,如果你认为「两个孩子都是男孩的概率是 1/3」是「至少有一个男孩」这一类孩子集合的内在属性,那它就和下面这些说法不一致:老大是男孩的孩子集合,其内在地有 1/2 的概率是两个男孩;老二是男孩的孩子集合,其内在地也有 1/2 的概率是两个男孩。这就好像是在说:「所有绿色苹果都重一磅,所有红色苹果都重一磅,而所有绿色或红色的苹果都只重半磅。」
一旦你开始像这样思考——仿佛概率存在于事物之中,而不是概率只是关于事物的局部信息状态——就会发生这种事。
概率表达的是不确定性,而只有行动者才会不确定。一张空白地图并不对应一片空白疆域。无知存在于心智之中。